普通网线也能跑万亿大模型!月之暗面抛出王炸架构,亲证:不用全买 H100!1T模型实测:延迟暴降64%!大模型推理“围城”攻破了!
普通网线也能跑万亿大模型!月之暗面抛出王炸架构,亲证:不用全买 H100!1T模型实测:延迟暴降64%!大模型推理“围城”攻破了!在 AI 工程界,长文本推理一直是个“富贵病”。
在 AI 工程界,长文本推理一直是个“富贵病”。
最近,运营社就发现了一个闷声发财的 AI 工具——星月写作。它专门帮网文作者用 AI 高效创作,没有互联网大厂投资背景,也没有牛逼的研发团队,上线一年就做到了 2 万+ 月活用户,靠用户付费订阅与增值服务,8 人小团队每月入账上百万元。
一直以来,我都觉得,对于 AI Agent 来说,最好的 Skill(技能)就是各种 APP。特别是在国内,大部分 APP 都是不那么 Open 的。不过最近,我发现了一个宝藏开源项目,可以解决这个问题。它叫 Turix CUA。
去年营收1.1亿的原生影视工作室Utopai火起来,又一次彻底刷屏!奥斯卡编剧下场背书,这家公司直接复刻了皮克斯的神话。从剧本到4K大片一键直出,AI视频刚刚完成了一次史诗级升级。
“Claude 正在自掘坟墓。它自认为是 AI 公司中的苹果。”
当Claude随时可能被收回,百度这次想做的是把 AI 真正变成能替你接活、跑流程、交结果的工作「搭子」——DuMate。
如果把今天最热门的几个方向摆在一起看,你会发现它们其实在卡同一道坎。
黄仁勋曾经说过,AI 时代 token 就是货币,那么谁会是 token 最大的消费者?
ATM-Bench 将「个人 AI 助手是否真的记得你」这件事,变成了一个研究的测试基准。结果并不乐观:专用记忆智能体系统普遍低于 20%,而 OpenClaw、Codex、Claude Code 等通用智能体普遍表现不佳,最高准确率不到 40%。
本文主要介绍来自该团队的最新论文:Scalable Object Relation Encoding for Better 3D Spatial Reasoning in Large Language Models。